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用 于 Hadoop 平台 的 混沌 加 密 研究 与 实现 ” 
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摘 要 : 为 解决 传统 单机 模式 串 行 加 密 方 法 存在 的 不 足 ， 设 计 了 一 种 基于 Hadoop 平台 的 混沌 加 密 算 法 的 运行 方案 

该 方案 运用 MapReduce 并 行 框架 和 混沌 加 密 伪 随机 数 以 及 初 值 敏感 的 原理 ， 提 出 一 种 针对 MapReduce 框架 和 混沌 加 
密 优 化 的 并 行 混沌 加 密 方案 ， 即 用 明文 长 度 作 为 初 值 ， 分 别 对 Chen, Lorenz, Rossler 三 种 超 混沌 系统 进行 初始 和 迭代， 
同时 提出 对 明文 数据 按 1Mb 进行 分 块 的 设计 理念 ,通过 根据 偏 移 量 , 判断 每 个 分 块 生成 长 度 为 1Mb 的 Chen, Lorenz, 

Rossler 三 个 密 角 序列 的 方法 ， 达 到 提升 数据 密度 安全 性 、 减 少 运行 内 存 占有 量 等 目的 。 该 设计 框架 中 ,Chen 序列 用 于 
明文 置 乱 操作 ，Lorenz 序列 用 于 异 或 的 扩散 操作 ，Rossler 序列 用 于 取 模 的 辅助 扩散 操作 。 实 验证 明 ， 针 对 MapReduce 
并 行 框架 特性 和 混沌 系统 特性 的 优化 算法 ， 在 能 够 有 效 减 小 内 存 占用 量 、 又 可 以 提高 加 密 速 度 的 同时 ， 明 文 关 联 的 加 
密 操 作 达 到 了 有 效 防御 选择 明文 攻击 的 目的 。 
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Chaotic encryption research and application based on Hadoop 


Xieguobo, Yaozhuochen 


(Faculty of Computer Guangdong University of Technology, Guangzhou 510006, China) 


Abstract: In order to solve the shortcomings of the traditional serial encryption method in single machine mode, such as the 
low density of data security, the difficulty in encrypting-efficiency to meet the requirement of increasing information data 
encryption and the excessive amount of memory in the running process, and so on. This paper designed a scheme of chaotic 
encryption algorithm based on Hadoop platform. The scheme used MapReduce parallel framework, chaotic encryption 
pseudorandom number and the principle of initial value sensitivity. A parallel chaotic encryption scheme for MapReduce 
framework and chaotic encryption optimization is proposed. That is, using the length of the plaintext as the initial value, uses 
Chen, Lorenz, Rossler chaotic system to generate secret key. At the same time, A the idea of dividing plaintext data into blocks 
according to 1Mb was proposed. According to the offset, each block can be judged to generate three key sequences of Chenn 
Lorenzl Rossler whose length is 1Mb. To improve the security of data density, reduce the amount of running memory and other 
purposes. In this design framework, Chen sequence is used for plaintext messing operation, Lorenz sequence is used for XOR 
diffusion operation and Rossler sequence is used for modular auxiliary diffusion operation. Experiments have proved that, for 
MapReduce, The optimization algorithm of using parallel framework and chaotic system can effectively reduce the amount of 
memory and improve the encryption speed, and the encryption operation associated with plaintext achieves the purpose of 
effectively defending against the attack of selected plaintext. 
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求 也 日 益 提 高 。 近 几 年 大 数据 网 络 安全 问题 已 成 学 术 界 的 热门 
讨论 话题 ， 这 也 成 了 信息 安全 领域 有 待 开发 提高 的 热点 课题 之 
近年 来 ， 随 着 计算 机 网 络 及 应 用 技术 的 迅猛 发 展 ， 在 信息 ”一 。 面 对 网 络 及 应 用 技术 的 升级 换代 ， 海 量 信息 数据 的 产生 ， 


领域 所 产生 的 数据 量 以 指数 级 膨胀 。 随 着 企业 、 个 人 等 隐私 信 ”当前 传统 的 单机 模式 串 行 加 密 方 法 因 受 其 内 存 、 处 理 器 规模 等 
生 条 件 所 限 ， 在 效率 上 和 内 存 占用 上 己 难 以 满足 对 大 量 数据 


息 存 在 泄密 或 受到 安全 威胁 的 情况 出 现 ， 人 们 对 数据 安全 的 需 ” 硬 | 
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的 加 密 要 求 。 而 对 于 更 大 数量 级 的 数据 环境 中 ， 则 面临 计算 负 

载 可 能 远 远 超出 单 台 计 算 机 的 运算 极限 等 情况 的 困扰 。 针 对 上 

述 浆 端 ， 提 升 数据 安全 保护 变 得 愈 发 重要 。 随 着 云 计算 的 出 现 1.1 混沌 系统 

为 大 数据 加 密 提供 了 全 新 的 思路 。 目 前 通用 方法 为 建立 云 计 算 1.1.1 Chen 超 混沌 映射 

集群 平台 ， 通 过 将 每 个 计算 机 封装 成 一 个 计算 节点 ， 每 个 节点 Chen 的 超 混沌 系统 HL9 可 以 描述 为 
可 用 以 储存 或 处 理 海量 数据 。 该 法 也 因 建 成 成 本 低 而 成 为 众多 

企业 、 科 研 单位 等 的 合理 选择 。 但 是 ， 该 平台 只 为 本 文 提 供 了 
有 效 处 理 海 量 数据 的 平台 ， 却 本 身 缺 乏 高 效 加 密 的 手段 ， 由 此 

导致 重要 的 科研 数据 、 业 务 资料 或 客户 材料 等 隐私 信息 存在 容 

易 泄密 的 危险 。 如 何在 大 数据 平台 的 基础 上 ,设计 一 种 针对 ”其 中 : a、b、c、d 为 系统 参数 , 当 参 数 为 a=35,b=3,c=12,d=7 时 ， 
MapReduce 框架 有 所 优化 并 行 加 密 的 算法 ， 是 本 文 要 解决 的 间 ” 混沌 系统 的 解 如 图 1 所 示 。 


题 。 


1 ”背景 知识 


本 文 所 提 用 于 Hadoop 平台 的 混沌 ， 是 确定 性 系统 中 的 随 
机 运动 。 它 的 典型 特征 主要 体现 在 两 点 : 对 初始 条 件 的 高 度 敏 
感性 和 良好 的 伪 随 机 性 质 。 它 与 传统 密码 学 中 的 扩散 、 密 钥 、 
一 帮 代 等 有 许多 相似 之 处 。 目 前 并 没有 太 多 关于 混沌 加 
> 。 用 在 Hadoop 大 数据 平台 的 研究 。2015 年 ， 文 献 [5] 提 出 了 基于 
MapReduce 的 并 行 多 混沌 加 密 方案 ， 利 用 Logistic，Henon， 
Lorenz, Chen 等 低 维 的 混 动 系统 ， 产 生 初 值 和 干扰 值 对 明文 的 
对 应 ASCI 码 进行 加 密 运 算 。2017 年 , 文献 [6] 提 出 了 一 种 基于 | 2 R 
Hadoop 大 数据 平台 和 无 简 并 高 维 离散 超 混沌 系统 的 加 密 算法 ， i rn 
该 法 采用 流 密码 对 称 加 密 方式 ,利用 李 氏 指数 均 为 正 数 的 特点 ， 图 1 混沌 系统 1 
设计 高 维 离散 超 混沌 系统 进行 加 密 ， 其 优点 体现 在 具有 更 好 的 1.1.2 Lorenz 超 混沌 映射 
统计 特性 。 同 年 ， 文 献 [7] 提 出 了 在 Hadoop 平台 使 用 ARIA 算 Lorenz 的 超 混沌 系统 由 可 以 描述 为 
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法 的 架构 ， 该 架构 下 用 户 可 以 选择 AES 或 ARIA 算法 进行 加 z= a(y> x) tw 
。 基 于 上 述 文献 阐述 的 算法 ， 本 文 作 者 认为 还 有 以 下 有 待 改 oR a 
1 地方 ， 低 维度 的 混沌 系统 的 正 李 氏 指数 并 不 够 大 ， 没 有 很 w=-yz+rw 


的 统计 学 特性 产生 的 问题 ; 并 没有 针对 MapReduce 并 行 计 算 其 中 : a b, c 为 系统 参数 ， 当 a=10,b=8/3,c=28,r=-1 时 ， 系 
进行 优化 。 对 每 个 分 块 的 明文 运算 中 出 现 太 多 元 余 计算 ， 统 进入 混沌 ， 该 参数 下 的 混沌 系统 如 图 2 所 示 。 
因而 占用 了 系统 内 存 ， 减 慢 了 运算 速度 。 

为 解决 和 优化 上 述 不 足 , 本 文 设计 并 实现 了 一 种 加 密 方 案 : 
即 基 于 Hadoop 的 多 个 超 混沌 系统 的 算法 ， 该 算法 首先 ， 对 明 
文 数据 按 1Mb 分 组 的 同时 根据 明文 数据 的 大 小 取出 四 个 初 值 
于 初始 和 迭代， 使 之 加 密 序列 不 受 系统 过 渡 过 程 的 影响 ， 同 时 0 
又 因 混沌 系统 的 伪 随 机 性 ， 初 值 和 迭代 次 数 相 同 的 运算 总 会 得 
出 同样 的 密码 序列 的 原理 , 故 可 在 MapReduce 开始 阶段 进行 初 如 
MAR, 避免 并 行 加 密 时 的 元 余 运 算 。 在 每 个 Mapper 运行 时 ， 
根据 偏 移 量 依次 生成 Chen、Lorenz、Rossler 的 超 混沌 系统 密 钼 ， 
其 中 Lorenz 系统 的 初 值 是 Chen 系统 的 262144 次 迭代 值 ， 
Rossler 系统 同 理 。 对 每 一 个 Mapper 读 取 的 明文 数据 ， 根 据 其 


Sr 


偏 移 量 进行 Chen 密 钥 的 置 乱 操作 ，Lorenz 密 钥 的 异 或 操作 ， 图 2 混沌 系统 2 
Rossler 密 钥 的 取 模 操作 。 最 后 由 Ruducer 完成 密 文 的 拼接 工作 。 1.1.3 Rossler 超 混沌 映射 

本 文 设计 的 加 密 算法 , 不 仅 针对 MapReduce 框架 作出 优化 处 理 ， Rossler 的 超 混 沌 系统 09 可 以 描述 为 
而 且 根据 混沌 系统 自身 的 特性 ， 有 效 的 提高 了 加 密 速度 ， 降 低 


了 内 存 占 用 量 。 
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其 中 : a、b、c、d 为 系统 参数 ， 
系统 进入 混沌 态 . 


当 a=0.25,b=3,c=0.5.d=0.05 时 ， 


2 MapReduce 并 行 多 混沌 加 密 方 案 


本 文 所 设计 的 这 种 基于 Reduce 的 
针对 MapReduce 框架 优 


密 方案 , H 


并 行 多 混沌 的 超 混沌 加 
化 , 多 混沌 更 多 的 正 值 李 


氏 指 数 等 特点 , 相 较 一 般 的 加 密 
内 存 占 用 量 更 小 、 
2.1 具体 加 密 方案 
本 文 的 多 混沌 力 


算法 有 密 钥 空间 大 、 安 全 性 高 、 


加 密 速度 更 快 的 优点 。 


0 密 方 案 运 用 了 Chen、Lorenz、Rossler 三 个 


超 混沌 系统 ， 通 过 
进行 加 密 。 


ial, 1 


E 反 异 或 操作 、 正 反 取 模 操作 对 明文 
多 个 超 混沌 系统 不 仅 各 自 的 正 李 氏 指数 更 多 ， 而 且 


SF oot 
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han 
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会 更 少 , 


单个 混沌 序列 对 大 数据 量 的 明文 加 密 
而 单个 混沌 序列 所 需要 的 内 存 占 | 


密 ， 其 所 需要 的 迭代 次 
j 随 着 明文 的 数 


St 
Ty 


7 
ad p 
EC E 
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增 大 而 增 大 ， 加 密 


民 好 的 服务 于 大 数据 平台 


效率 也 随 着 数据 量 的 


曾 大 而 减少 ， 显 然 
的 海量 数据 源 。 将 明文 分 块 ， 


F 


按照 偏 移 量 生成 密 钥 序列 ， 根 据 读 入 的 明文 偏 移 量 同 时 进行 加 


密 ， 能 够 很 好 的 解决 该 问题 。 


a) 将 明文 按照 每 一 块 大 小 为 1Mb 分 成 N 块 。 明 文 前 N-1 块 


大 小 为 Mb, $ N RAR ARB 
RT. A. 
过 过 渡 态 。 


b) 对 于 每 一 个 分 块 ， 


分 别 通 


= 


作 连 续 超 混 沌 系统 ， 利 ) 


十 、 个 位 数 作为 混沌 系统 的 输入 进行 300 VCE ABE 


射 生 成 密 钥 序列 。Chen、Lorenz、Rossler 超 混沌 系统 均 为 四 
欧 拉 法 


体 的 加 密 方案 如 下 所 示 ; 


居 。 同 时 根据 明文 的 大 小 ， 分别 


过 Chen, Lorenz, Rossler 混沌 


解 出 混沌 系统 ， 每 个 混沌 系统 


每 经 过 


其 中 :每 个 序列 迭代 次 数 为 2621 


一 次 过 代 则 生成 四 个 随机 序列 ， 


即 为 十 二 个 混沌 序列 : 


44 次 (1/4 MB) Lorenz 系统 


的 输入 为 Chen 系统 的 第 262144 次 迭代 输出 , Rossler 系统 的 输 


入 为 Lorenz 系统 的 第 262144 次 迭代 输出 。 
co 对 于 生成 的 十 二 个 混沌 序列 ， 


万 然 有 较 大 的 不 足 ， 比 如 


均匀 分 布 特性 不 佳 ; 


局 部 取 值 存在 单调 性 ; 


序列 之 间 的 相关 度 


较 高 等 等 ， 所 


[以 在 对 明文 进行 加 密 之 前 仍 需 要 分 别 对 三 个 超 混 


沌 系统 进行 预 处 理 ， 通 过 


预 处 理 去 


除 各 实数 值 的 整数 部 分 ， 统 


一 值 域 ， 去 除 实 数值 后 再 将 小 数 点 后 移 9 位 ， 达 到 增强 序列 取 


值 的 无 规则 1 


完成 序列 的 预 处 理 之 


后 ,由 


生 和 整体 分 布 的 均匀 性 名， 


辑 ， 取 每 一 行 明文 数据 对 应 的 ASC H 码 M， 根 据 其 偏 移 量 
选择 对 应 的 序列 进行 置 乱 ， 然 后 进行 正 反 向 异 或 扩散 ， 最 后 进 


体操 作 如 下 式 : 


民 据 Map Reduce My BRIBE 


行 正 反 向 取 模 扩散 操作 进行 二 次 


图 3 所 示 ， 具 体 运算 操作 如 下 : 


扰 加 密 ， 算 法 运算 流程 图 如 


HAH, 


图 3 算法 流程 图 


Chin 
等 : 用 于 Hadoop 平台 的 混沌 加 密 研 究 与 实现 


Reduce 


Reduce FÅ 2 


ER . 
六 


a) 置 乱 操 作 。 

(2) 

A 

b) 正 反 向 异 或 操作 。 
(a) 正 向 异 或 。 

(3) 
(b) E FEER o 

(4) 
co) 正 反 向 取 模 操作 。 
(a) 正 向 取 模 。 

(5) 
(b) 反 向 取 模 。 

(6) 
经 过 上 述 加 密 操 作 后 得 到 最 终 密 文 。 


2.2 MapReduce 实现 力 


MapReduce 


行 框架 中 , 主要 | 


IER 


Mapper fil Reducer 组 成 ， 


Mapper 主要 作为 父 类 ， 


通过 


继承 Mapper 重 写 map 方法 实现 对 


数据 的 逐 行 读 取 ， 进 行 


上 日 关 的 数据 处 理 。map 方法 将 数据 分 成 
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了 多 个 子 任务 , 分 配给 多 个 处 理 器 同时 完成 计算 ，Mapper 数量 
分 块 数 决定 ， 每 一 个 Mapper 完成 子 任务 的 加 密 操 作 。 最 后 
交 由 Reducer 负责 整合 所 有 Mapper 输出 的 结果 。 综 上 可 知 ,本 
文 提出 的 并 行 加 密 方案 中 ， 每 一 块 加 密 计 算 都 是 独立 完成 的 ， 
块 与 块 之 间 并 没有 产生 相互 的 干扰 。 因 此 MapReduce 实现 可 以 
分 为 三 个 部 分 : Split, Map, Reduce. 
2.2.1 Split 

本 文选 择 将 输入 数据 按 1Mb 大 小 进行 分 割 ， 这 样 一 个 N 
Mb 的 文件 就 会 被 分 成 N 块 。 
算法 1 Split 算法 
输入 : 加 密 文件 
输出 : 1Mb 大 小 的 文件 分 块 
InputFormat() 
isSplitable() 


getSplits() 

if((length!=0)&&isSplitable()) 

blocksize=1048576 

return splits 

那么 对 于 前 N-1 个 分 块 , 分 块 大 小 都 为 1Mb, 并 以 K-V 键 
值 对 的 形式 传输 给 N A Mapper, AK (Key) 为 明文 块 的 第 
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23 ”算法 安全 性 分 析 
2.3.1 密 钥 空间 

基于 MapReduce 的 并 行 多 个 超 混 沌 加 密 方案 , 由 于 超 混沌 
系统 本 身 就 具有 很 好 的 安全 性 ， 辅 助 MR 每 个 Mapper 单独 计 
算 的 工作 原理 ， 使 得 这 种 加 密 方 案 不 仅 能 够 胜任 海量 数据 的 加 
密 要 求 ， 并 对 超 混 沌 系统 的 安全 性 没有 消极 影响 。 通 过 统计 得 


= 


th, VANE TT SS LT = EARS ERA > 


， ; 三 个 超 混 沌 系统 明文 关联 的 初 值 


和 参数 


假设 他 们 的 值 为 : 
初始 迭代 数 
e Dig. Iy Li. ote 


, WMA, 1, 1,1, 1, 1, 1, 
以 及 各 自 超 混沌 系统 的 参数 


则 需要 


10700 Byte 空间 存放 ， 即 85600 故 破解 组 合 数 为 


一 个 字 节 偏 移 量 ，V (Value) 为 明文 块 的 具体 值 。 这 样 每 个 
Mapper 在 进行 加 密 处 理 的 时 候 都 是 并 行 且 无 不 干扰 的 。 
2.2.2 Mapper 

经 过 分 块 之 后 ,每 一 个 Mapper 将 单独 计算 明文 的 一 部 分 。 
Mapper 之 间 的 计算 没有 通信 。 每 一 个 Mapper 都 进行 3.1 中 的 
B) Z D) 运算 。 当 偏 移 量 ==-0 或 1048576- (mod1048576) <n 
时 ， 进 行 一 次 B) 运算 ， 然 后 根据 读 入 数据 的 每 一 行 的 偏 移 值 
找到 对 应 的 密 钥 序列 ， 分 别 进行 置 乱 ， 正 反 蜡 或 ， 正 反 取 模 的 
加 密 处 理 。 最 后 输出 为 K-V X, KAMEI. V 为 已 加 密 的 局 
部 密 文 。 

算法 2 Mapper 

输入 : <LongWritable,Text> 

输出 : <LongWriatble,Text> 

if(==0&&1048576- (mod1048576) <n) 

ChenGen() 

LorGen() 

RossGen() 

=MessUp(,); 

=Xor(,); 

=Mod(,); 
2.2.3 Reducer 

当 所 有 的 Mapper 完成 了 局 部 密 文 的 加 密 操 作 ，Reducer 将 
根据 Mapper 输入 的 K 进行 排序 ， 排 序 后 的 密 文 即 为 完整 的 密 
文 ，Reducer 输出 后 便 是 所 求 密 文 。 


DLs 
可 见 密 钥 空间 足够 的 大 ， 足 以 抵抗 暴力 破解 密 钥 攻 击 ， 并 且 随 
着 初 值 的 增 大 ， 密 钥 空 间 的 增长 也 是 指数 级 的 。 
2.3.2 直方 图 分 析 

另 采用 含有 多 个 超 混沌 的 加 密 算法 的 加 密 文本 统计 如 图 4 
所 示 。 由 统计 直方 图 可 知 ， 明 文 经 过 加 密 算法 的 加 密 后 ， 其 统 
计 特 性 改变 相当 明显 。 


5 
x10 


(a) 加 密 前 的 直方 图 


(b) 加 密 后 的 直方 图 
图 4 统计 直方 图 


2.3.3 初 值 敏感 性 

同时 该 算法 的 初 值 敏感 性 也 非常 良好 ， 由 于 文本 数据 并 不 
如 图 像 数据 在 观察 算法 初 值 敏感 性 上 直观 ， 所 以 采用 加 密 后 的 
密 文 相关 性 比较 ， 分 别 用 1 和 1.00000001 对 同一 个 文件 加 密 ， 
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得 出 两 次 密 文 如 区 


分 块 之 间 的 


5 所 示 , | 


60000 


Frequency 


0 20000 


次 密 文 的 相关 性 仅 为 0.05130069 。 


初 值 为 1 的 密 文 的 直方 图 
0 fe 40 i ři 120 

i £ ee SOL 8 

irs Brel 

peal e 

var 1 seat ade 


0 40 80 120 
boii 111 


3 
we var 2 


ce oe E E E, 
0 20 40 60 80 120 


图 6. 初 值 为 1.00000001 密 文 与 初 值 为 1 的 密 文 相关 性 比较 
2.3.4 相关 性 分 析 


在 MapReduce 
统 单机 模式 下 的 算法 有 根本 的 结构 
互相 关 性 是 研究 算法 安全 性 的 重要 一 环 。 令 各 个 分 


块 的 明文 数据 的 内 容 完全 相同 〈 图 7) 


了 框架 下 对 明文 进行 混沌 加 密 算 法 与 传 
区 别 ， 因 此 考察 算法 的 各 个 


， 对 明文 加 密 后 各 分 块 


相关 性 如 图 


RRI, HZ 


间 的 相关 性 很 小 。 


40 80 120 
piiit 


40 80 120 


7 ARTE 


40 80 120 


全 相同 的 明文 


0 40 80 120 


0 40 100 


0 40 100 


0 40 80 120 


2.3.5 已 知 明文 攻击 与 选择 明文 攻击 


在 加 密 过 程 中 ， 


[0 密 后 各 个 密 文 的 相关 性 


密码 系统 的 密 钥 参数 


Cis=(Xis 驴 ,B,Ci,Ri),i=C,L,R 在 每 一 次 加 密 过 程 都 保持 不 变 ， 
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另外 根据 已 知 明文 攻击 的 条 件 ， 攻 击 方 获知 任意 明文 ， 并 且 知 
道 这 些 任意 明文 对 应 的 密 文 。 同 理 ， 选 择 明 文 攻击 的 条 件 中 ， 
攻击 者 通过 选择 对 破译 有 利 的 明文 以 及 对 应 的 密 文 

那么 对 于 与 明文 无 关联 的 算法 ， 对 于 任意 一 次 明文 
M(i),i=1,...,N 加 密 ， 得 到 的 对 应 加 密 密 钥 序列 均 为 


K, ={K,(O), K.0),….…K(N)} ， 那 么 攻击 方 只 需要 两 步 便 可 破 
译 密码 。 
获取 等 价 密 钥 K(k) 


假设 攻击 方 第 一 次 进行 加 密 的 明文 为 MQ), 则 对 应 密 文 应 
为 
C, =C 四 9 ®{mod[(C_, + S,) + Mess[M,],128]}i=1,2...262144 
则 攻击 方 可 通过 加 密 公 式 的 逆 运 算 获 得 对 应 9， 若 不 采取 
明文 关联 的 密 钥 生成 方案 ， 则 S, = K(k) 
等 价 密 钥 K(k) 破译 加 密 后 的 明文 

腿 设 攻击 者 第 n 次 加 密 的 明文 为 M(n mE 
保持 不 变 , 故 可 获得 对 应 密 文 C， 进 而 可 以 利用 等 价 密 
相应 的 明文 。 

而 本 文 设计 的 加 密 方案 根据 明文 首 字母 的 ASCII 码 作为 密 
钥 输 入 ， 参 与 到 混沌 序列 的 运算 中 ， 使 得 在 加 密 不 同 的 明文 
M(i),i=1,.. vo BAKO 总 是 变化 的 ,不 再 是 保持 恒定 不 变 。 
此 可 见 ， 本 文通 过 采用 了 与 明文 关联 的 方法 ， 具 有 抵御 已 知 
月 文 攻击 和 选择 明文 攻击 的 能 力 。 


3 ”实验 结果 以 及 分 析 


3.1 实验 环境 
采用 的 Hadoop 大 数据 平台 为 Master-Slaves 结构 ， 由 4 个 
节点 组 成 ， 包 括 1 个 master 节点 和 3 个 slaves 节点 。 节 点 硬 
件 配置 为 CPU Interi3-8100,3.60 GHz/6MB Cache, 内 存 24 GB, 
磁盘 256 GB SSD， 千 兆 以 太 网 卡 。 
操作 系统 为 Linux Ubuntul6.04, Hadoop 版 本 2.6.5, Java 
版 本 jdkl1.7.0_ 79, 开 发 环境 EclipseLuna Service Release 2(4.4.2 )。 
3.2 ”执行 效率 分 析 

在 单个 计算 机 运行 加 密 算法 的 情况 下 ， 运 行 较 大 的 密 文 加 
密 运算 时 往往 会 受 限 于 单机 计算 性 能 的 局 限 ， 内 存 占用 和 运算 
速度 都 会 极 大 的 受到 影响 ， 甚 至 会 出 现 内 存 溢出 加 密 失败 的 问 
fl. 而 基于 MapReduce 框架 下 的 混沌 加 密 算法 能 够 很 好 的 解决 
这 个 问题 。 运 用 本 文 设计 的 加 密 算 法 在 加 密 64 MB、128 MB、 
256 MB 的 文本 文件 效率 对 比 和 内 存 占用 量 如 图 9、10， 表 7、 
8 所 示 。 结 果 表 明 ， 针 对 MapReduce 架构 优化 后 的 混沌 加 密 算 
法 相 较 单机 模式 以 及 MapReduce 默认 按 行 读 取 方式 加 密 有 更 
小 的 内 存 占用 量 和 更 快 的 加 密 速度 

单机 环境 下 对 128 MB 大 小 的 明文 进行 加 密 时 就 收 到 了 内 
存 的 限制 因 内 存 溢出 而 出 错 ， 而 加 载 64MB 大 小 的 文件 情况 也 
非常 不 乐观 。 而 优化 后 的 MapReduce 并 行 算法 通过 每 1Mb 3% 
代 生 成 长 度 为 Mb 的 密 钥 序列 , 有 效 的 减少 了 生成 混沌 密 钥 时 
所 需要 的 元 余 迭 代 , 同时 因为 加 密 完 成 后 密 钥 序列 便 可 以 清空 ， 


m 


di 
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从 而 大 大 减少 了 运行 时 的 内 存 占用 量 ， 


可 以 看 到 在 Reduce 阶 


段 ， 因为 只 用 了 一 个 核 负责 所 有 密 文 的 


接 工 作 , 所 以 Reduce 


在 相同 文件 大 小 的 情况 下 所 需 时 间 大 致 相同 。 
i=] 
3 | —e— MapTime 
5 -2 ReduceTime 
SH “十 ”TotalTime 
一 i F 
三 8 Ga Ta Mi 
H “ee 
3 | oo 
= =| 
六 
ot T T T T T 
64 单 机 128MR 256MR 128 优 化 后 MR ”256 优 化 后 MR 
PATTERN 
图 9 各 个 模式 下 的 对 应 文件 大 小 加 密 时 间 
表 7 各 个 模式 的 时 间 统 计 
时 间 /s 64 单机 128MR 256MR 128 优化 后 256 优化 后 
Map 3273 1509 2725 931 1929 
Reduce 402 348 728 339 672 
Total 3675 1857 3453 1270 2601 
内 存 使 用 情况 
oO 国 256MR 
2 m 64 单 机 
N m 256 优 化 后 MR 
国 128MR 
= oO m 128 优 化 后 MR 
O © 
E @ 
oo 
| | 
i | 
Oo 
oO 
i I ull 
区 E 
used free cache 
图 10 各 个 模式 下 的 对 应 文件 大 小 内 存 占 用 量 
表 8 各 个 模式 的 内 存 统计 
内 存 /MB 64 单 机 128MR 256MR 128 优化 后 256 优化 后 
map 9940 6086 11982 5737 7370 
reduce 1504 3826 158 6582 3194 
total 4573 6105 3876 3698 5453 
4 ”结束 语 


加 密 算法 ， 并 在 MapReduce 并 行 运算 框 


决 了 加 和 密 运 行 时 的 内 存 占用 量 。 
超 混沌 系统 ， 利 用 其 多 个 正 李 氏 指 数 的 
加 密 ， 同 时 根据 MapReduce 


本 文 提出 了 一 种 针对 MapReduce 和 混沌 系统 优 
该 
得 了 预测 的 实验 结果 ， 结 果 表 明 本 文中 的 算法 能 够 实现 海量 数 
据 的 加 密 工作 ， 有 效 地 降低 了 加 密 时 间 ， 密 
本 算法 的 创新 点 在 于 使 用 多 个 


行 框 架 的 特点 ， 


化 的 并 行 
算法 ， 取 


BAB SEEM TY 


提高 了 加 密 效率 ， 解 


良好 统计 学 特性 对 密 广 
修改 了 


MapReduce 默认 的 每 个 Mapper 按 行 读 ] 


取 数 据 只 能 按 行 加 密 的 
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方案 ， 通 过 科学 地 分 配 Mapper 处 理 明 文 分 块 ， 并 在 每 个 分 块 


Lb 


成 相应 长 度 的 密 钥 序列 ， 在 减少 了 


抑 余 迭 代 的 同时 实现 了 内 


存 的 有 效 再 分 配 。 实 验 表明 本 算法 在 同类 加 密 方案 中 提升 了 密 


文 的 安全 性 、 同 时 具有 更 优秀 的 加 密 速度 、 减 少 了 加 密 运行 时 


的 内 存 


5 用量 


I E> 


提供 了 更 理想 的 内 存 空间 。 
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